科普 | 语言学家的迷惑例句:关于性别问题的严肃讨论
The following article is from 人类语言体验机 Author Wug Bot
例句,是语言学领域的核心研究工具之一,是论证研究观点的关键证据。
阅文献无数的你应该对张三、李四、John、Mary不陌生,这些人常常是例句的主角,说各种陈述句疑问句感叹句,表达各种情感,做出各种有意思的没意思的举动。
语言学家创造出这些人,又被这些人所“创造“。
可是,你有没有发现例句里男性身影和女性身影出现频率的差异?
是不是John总是kiss Mary,但Mary自不自愿并不清楚?
是不是John总拥有一辆car,而Mary要去为孩子买rice?
当作者需要假设情境时写“想象有一个人”,接下来用人称代词进行回指时,看到的更多是“他、he”,而不是“她、she”?
一些语言学家已经注意到了:
语言学领域文献所用例句里的性别偏见和性别刻板印象的问题。
在本篇推文中,wug来向大家介绍一些相关研究,看一看语言学家笔下的例句存在什么问题,这些年来问题有没有解决,以及如何解决。
研究结果非常「有趣」!眼睛不要移开~
一
M&B(1997)的开创性工作:性别偏见浮出水面
Macaulay & Brice在1997年首次对语言学文献中例句的性别问题展开研究。他们调查了1969年至1994年出版的10种语法教科书中的例句,其中7本男性作者,3本女性作者。从每本教科书中随机抽取200例,标注如下信息:
语法功能:主语,直接宾语,间接宾语
题旨角色:施事(agent),受事(patient),经验者(experiencer),接受
词汇选择:代词,专有名词,暴力,外貌
他们的研究结果表明,所引用的男性为主角的例句比女性为主角的例句更高,两种性别都具有很强的刻板印象。
其中的性别偏见特征分别总结如下:
男性例句特征
比女性例句的出现频率更高;
作为主语和施事的频率比女性例句更高;
在男性例句中,比起其他角色,更多作为主语和施事;
提及的男性代词比女性更多;
提及男性名字的次数是女性的两倍;
更多出现在智力活动中,比如阅读书籍,和汽车打交道;
更多描述为有职业人士,并且职业范围更广;
暴力行为比女性例句更多。
女性例句特征
经常缺少名字,与男性相比,更多以亲属关系来指称(某人的妻子、某人的母亲);
对女性外表的描述多于男性。
来品一品其中一些例句:
Harry watches the fights and his wife the soap operas.
Bill is proud of his father and tired of his mother.
Every painting of Maja and photograph of Debbie pleased Ben.
The man is hitting the woman with a stick.
还有一些包含或显性或暗示性语言的例句:
Max doesn’t beat his wife because he loves her.
She’s fond of John naked.
She’ll soon tire of her sexploits.
John forced Mary to be kissed by Bill.
那么,作者的性别对使用例句的性别倾向有没有影响呢?
研究发现:有。男性作者更倾向于使用有性别偏见的例句,而女性作者倾向于使用无偏见的例句。
二
Pabst等(2018)的后续研究:例句成长了20年并没有什么长进
二十年后的2018年,Pabst等人又对2005年至2017年间出版的语法教科书做了一项后续研究,以测试性别偏见是否有所改善。
但结果令人失望,男性例句的特征与M&B的研究中所列举的几乎无异,而关于女性例句的特征,研究发现描述女性外表的例句很少,但比男性例句展示出更多负面情感。
另外,大多数例句中的男女性别刻板印象仍然存在。
再来“欣赏”一些例句:
Bruce loved and Kelly hated phonology class.(语音学女孩来骂一骂)
Mary entertained the men during each other’s vacation. (为什么要这样折磨Mary)
Mohammed buys a house. (气抖冷,男性何时不再独享买房压力)
Slavko left his wife. (常常是丈夫离开妻子,而非妻子离开丈夫)
Mary may wonder if John cheats on her. (常常是男性欺骗女性感情)
三
Kotek等今年的新研究:或许要再等50年
Hadas Kotek et al.这项研究收集了语言学三个顶级期刊Language, Linguistic Inquiry, Natural Language & Linguistic Theory 从1997年到2018年发表的所有论文中的例句。其中1126篇论文使用了例句,总共30591个例句,其中806篇论文包含了至少一个人类性别例句,最终产生25085个第三人称人类性别例句供分析。
(具体的研究方法与设计大家可以去看原文)
下面我们来看一看研究结果吧~(以下结果都经过t检验证实具有统计学上的显著性)
例句的性别分布
在所有25085个例句中,22%是女性句(F),48%是男性句(M)。另外有7409个例句不涉及性别或难以分辨(A),占30%。
(所有例句中的性别分布)
在剩余的17676个性别句中,32%是女性句,68%是男性句,每1个女性句对应2.1个男性句。这个比率在三个期刊中的表现是一致的:
(三个期刊各自的例句性别分布)
语法功能和题旨角色
语法功能上,83%的男性句中分配了主语,而女性句中只有78%的句子分配了主语,女性句更多地分配了非主语位置。
题旨角色上,女性句显示30%的施事,31%的经验者,35%的受事和43%的接受者。
(左图:语法功能的分布;右图:题旨角色的分布)
代词和专有名词
代词方面,男性代词比女性代词更常见,分别为29%和23%。
(左图:代词;右图:专有名词)
名字方面,在所有10737个名字中,有428个模糊性别,其余10309个名字中,女性例句中包括33%的有名字例句和31%的无名字例句。而男女例句各自所占专名例句的比例差别不大,分别为58%和59%。
那么不同性别各自最常见的名字有哪些呢?
大家请看top5排行榜:
(张三和李四上榜!但是......李四真的是女孩子???)
(最常见的5个男性专名和女性专名)
top1当然还是大家的老熟人John和Mary,分别占比31%和30%。
有趣的是,在最常见的5个男性名字中,有2个是John的变体:John, Juan。
在最常见的5个女性名字中,则有3个是Mary的变体:Mary, Maria, Marie。
词汇选择
(一)涉及职业的例句
总体而言,涉及职业的例句中,男性句与女性句的比例为2.1:1。而在描述为拥有职业的例句中,这一比例接近3:1,男性句占比73%。
(涉及职业的例句)
(二)涉及暴力事件的例句
男性例句占比83%,比例高于4:1。不过在性别内部,主语和非主语的差别不大:在男性例句中,男性主语占比72%;在女性例句中,女性主语占比69%。
(左图:暴力事件句中的性别;右图:暴力事件句中的性别✖️句法位置)
(三)涉及浪漫或性暗示的例句
女性例句占比过高,为50%。这与语法功能之间具有相互作用,在主语和非主语的分布上,女性句仍更多地分配宾语位置,只有59%的女性例句分配了主语,而男性例句有76%分配了主语。
(左图:“浪漫”句中的性别;右图:“浪漫”句中的性别✖️句法位置)
(四)涉及亲属关系的例句
使用亲属关系来作为指称的女性例句占比很高,为57%,鉴于总体分布中2.1:1的男性倾向,这个数据结果是非常显著且惊人的。
(亲属关系的使用)
情感分析
该研究使用tidy-text包中的R函数“get-sentiments”对数据做情感分析。
结果表明,男性句更多地展现消极情绪,如愤怒和恐惧;相对而言,女性句更多表达积极情绪,如快乐和真诚。消极情绪的男女比例为2.3:1,高于总体男女比例2.1:1;积极情绪的男女比例微1.7:1。
(积极/消极情感)
又到了迷惑例句大赏环节
John ate the meal and Mary cleaned the dishes. (人言否?) John didn’t eat the meal because he would have to clean the dishes.(给我整笑了) Tomas replaced Ricardo as the captain. (小声问一句:我Mary......有没有......这个机会当captain呢) John thinks that he himself is a war hero.(有些男人那么普通,却那么......)
John told Bill that Mary began to cry without any reason.(女人的眼泪都是有原因的好吗,比如这句话)Which Nobel prize winning author came in his car?(每当有一个男性,他都要有一辆车......)Every male student doesn’t fear tigers.(老虎伤人事件中确实男性居多?)
荟萃分析(meta-analysis)
1.例句语言是否为英语,并不影响结果。在非英语例句中,只有31%的女性句。
2. 在过去20年里,例句的性别偏向呈现积极的平衡化趋势,我们已经向性别平等靠近了5%。
但以这样的速度,在其他条件不变的情况下,恐怕要再过50年才能对例句的男女平等有所期望。
四
这不仅关于「意图」,更关于「影响」
例句是理论语言学研究的主要语料来源。如大家所见,许多例子被引用得足够多以后,就会脱离其原始来源,成为特定语言现象研究的典型例句,比如驴子句:Every farmer who owns a donkey beats it.
例句是我们语言研究者的“武器”,然而,我们或许会经常忽视(有意或无意)例句的社会性的一面。如本文所介绍的研究显示,我们所使用的例句可能隐含着性别偏见,不仅对女性有刻板印象,男性也不例外。这样的例句很可能会传给一代又一代的语言研究者。这好吗?这不好。
也许我们可以更多地使用不含性别偏见的例句,而这样做的代价只是多考虑那么一点点。
美国语言学学会(LSA)从1996年就开始制定包容性语言指南,倡导语言学家关注包容性的学术写作,避免刻板印象的语言。该指南涉及范围很广,比如尽量使用性别中立的名字,如Chris,Dana,Kim,Lee,Pat;在论文插科打诨的部分应注意避免构建轻浮的、令人反感的、刻板印象的例句。大家感兴趣可以去LSA网站看一看~
P.S.
如果你看外文文献比较多的话,会明显发现,与经常使用she来举例的国外学者相比,国内的学者(就自拟例句而言)真的还有很长的路要走。
以及,真的忍不住再次发问:咱国的张三是男孩子、李四是女孩子?
参考来源:
Hadas Kotek, Rikker Dockum, Sarah Babinski, Christopher Geissler. Gender bias and stereotypes in linguistic example sentences. August 2020 Lingbuzz / 005367
Macaulay, Monica Ann., and Colleen. Brice. "Don't touch my projectile: Gender bias and stereotyping in syntactic examples." Language 73.4 (2015): 798-825.
https://www.linguisticsociety.org/resource/guidelines-inclusive-language
本文来源:人类语言体验机
科普/拾趣
科普 | 什么是语言学?语言学就是学语文的?语言学有何用武之地?
科普 | 为什么可以说“我爸爸”“我妈妈”,却不能说“我狗”?
科普 | “牛轧糖”的“轧”到底读“gᔓzhá”还是“yà”?
科普 | “蛋挞”“怼人”“撒贝宁”……这些词90%的人都读错了,不服进来看!
拾趣 | “年轻人不讲武德”“耗子尾汁”突然火出圈,英文怎么说?
拾趣 | 王安石叫Vans?朱棣叫Judy?网友起的古人英文名火了!
拾趣 | 98岁翻译家许渊冲,把宋词100首翻译成英文,美得令人沉醉
语言服务资源共享
11万+语言学人已关注
微信号:Language-service
投稿邮箱:yuyanfuwu@yeah.net
投稿交流、商务合作、著作出版欢迎后台留言